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O projeto que facilita o acesso a 
diários oficiais de municípios 


Cesar Gaglioni 21 de jul de 2021 (atualizado 21/07/2021 às 14h30) 


Plataforma da ONG Open Knowledge Brasil usa robôs para “raspar” 
publicações governamentais de cidades e reúne material para consulta. 
Objetivo é estimular transparência e acesso da população a informação 
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Lançado na terça-feira (20), o site Querido Diário 
(https://queridodiario.ok.org.br/) tem como objetivo 
reunir informações dos diários oficiais de municípios 
de todo o Brasil. 


A iniciativa é encabeçada pela ONG Open Knowledge 
Brasil, que desde 2013 tem entre suas bandeiras 
aumentar a transparência na relação entre governos — 
federal, estadual e municipal — e a sociedade. 


Na primeira fase do projeto, os usuários podem 
consultar o conteúdo dos diários oficiais de 12 capitais, 
mas a plataforma já tem uma linha de trabalho para 
expandir o escopo para 2.200 cidades. A meta final é 
conseguir cobrir as publicações dos 5.570 municípios 
do país. 


| Por que a plataforma foi criada 


Diários oficiais são jornais publicados pelo poder 
público. Neles, estão documentadas todas as decisões 
daquele governo — seja federal, estadual ou municipal. 
É possível ler neles todas as contratações que foram 
feitas, gastos, decretos, etc. 


Com o site, a Open Knowledge Brasil pretende não só 
reunir de forma mais acessível informações da gestão 
pública, mas também motivar gestores a facilitarem o 
acesso a elas. 


“Queremos estimular as cidades a usar um formato 
mais acessível de diário oficial. Esperamos que os 
gestores se sensibilizem a disponibilizar a informação 
de uma maneira mais fácil”, disse ao Nexo Fernanda 
Campagnucci, diretora executiva da Open Knowledge 
Brasil. 


De acordo com ela, o site também será uma fonte 
inesgotável de informações para jornalistas. “Nós não 
temos uma plataforma oficial que reúne tudo de todos 
os municípios, um Portal da Transparência único para 
as cidades. No Querido Diário isso será possível.” 


| Como o site funciona 


O projeto demorou cerca de dois anos para ficar 
pronto, segundo “Foi um trabalho que se intensificou 
em 2020”, disse Campagnucci. O site funciona assim: 


—— Um algoritmo faz uma “raspagem” na 
base de dados do diário oficial daquela 
cidade 


—— (Com a raspagem, todos as edições do 
diário oficial que foram disponibilizadas 
eletronicamente são reunidas e 
convertidas em texto 


—— As Informações são levadas para o site e 
podem ser consultadas livremente e 
gratuitamente 


“As primeiras raspagens demoram mais. Depois dela, 
para atualizar o site todos os dias, os robôs fazem isso 
muito mais rápido. Hoje [21 de julho de 2021] eles 
coletaram a edição do dia das 12 cidades em 10 
minutos”, afirmou. 


De acordo com a diretora executiva da ONG, o 
principal desafio do projeto é a falta de padronização 
nos diários oficiais. “Alguns diários têm páginas com 
duas colunas de texto, outros têm três colunas. Outros 
não são nem um arquivo em PDF [formato de texto], e 
sim uma imagem da publicação, essa é a maior 
dificuldade técnica que temos.” 


Além disso, termos técnicos dos próprios textos 
aparecem de forma diferente em cada cidade. “Para 
gasto público tem cidade que usa “compra”, outras usam 
“despesa”, outras usam “licitação”. E é por isso que 
temos uma inteligência artificial de busca semântica, 
que procura pelo significado dessas palavras e não pelo 
termo exato para reunir as informações de um tema 
específico.” 


| Projeto colaborativo 


Para conseguir implementar o projeto, é necessário 
usar um robô específico para cada cidade. Por isso, O 
Querido Diário é um projeto colaborativo. Todo o 
código 

(https://queridodiario.ok.org.br /tecnologia4contribua) 
usado na plataforma é aberto, e profissionais de 
tecnologia da informação podem colaborar com 
melhorias, adaptações e novas funcionalidades. 


Pessoas que querem contribuir com o projeto mas não 
são programadores podem fazê-lo de duas formas: 


—— Respondendo ao “Censo Querido Diário” 
(https://censo.ok.org.br/) , um 
formulário para apontar em qual site são 
publicados os diários oficiais de um 
determinado município 


—— Contribuindo com a campanha de 
financiamento coletivo 
(https://www.catarse.me/queridodiario- 
okbr) recorrente, com valores a partir dos 
R$ 10 mensais (a colaboração pode ser 
interrompida a qualquer momento) 


Por se tratar de um projeto com código aberto, a 
expectativa de Campagnucci é que surjam outros 
projetos derivados do Querido Diário. Um deles, 
segundo ela, já está sendo planejado pela ONG em 
parceria com o Google News Initiative 


(https://newsinitiative.withgoogle.com/intl/pt. br/) — 
programa da empresa americana para o fomento do 
jornalismo digital — para monitorar todas as 
informações ligadas à política de meio ambiente das 
cidades a partir do trabalho de raspagem do robô. Não 
há previsão para o lançamento. 
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